info

Bitva AI pokroků: Projekt Astra, Veo a vylepšení Gemini od Googlu

Toto je odpověď Googlu na OpenAI.

Obecná AI, AI, kterou lze skutečně používat každý den, by bylo trapné představit na tiskové konferenci, pokud to nyní není takto.

Ráno 15. května oficiálně začala každoroční „Jarní festivalová gala technologického světa“ na konferenci Google I/O pro vývojáře. Kolikrát bylo umělé inteligenci zmíněno v 110minutovém hlavním vystoupení? Google to spočítal:

Ano, o AI se mluví každou minutu.

Konkurence generativní AI nedávno dosáhla nového vrcholu a obsah této I/O konference se přirozeně točil kolem umělé inteligence.

„Před rokem na tomto pódiu jsme poprvé sdíleli naše plány na nativní multimodální velký model, Gemini. To znamenalo novou generaci I/O,“ řekl generální ředitel Googlu Sundar Pichai. „Dnes doufáme, že všichni mohou těžit z technologie Gemini. Tyto revoluční funkce proniknou do vyhledávání, obrázků, produktivity, systémů Android a mnoha dalších aspektů.“

V současnosti jsou k dispozici jak 1.5 Pro, tak 1.5 Flash pro veřejné preview a nabízejí kontextové okno o velikosti 1 milion tokenů v Google AI Studio a Vertex AI. Nyní také 1.5 Pro poskytuje 2 miliony tokenů kontextového okna pro vývojáře používající API a zákazníky Google Cloud prostřednictvím čekací listiny.

Kromě toho byl Gemini Nano rozšířen z čistého textového vstupu na vstup obrázků. Později v tomto roce, počínaje Pixel, Google uvede multimodální Gemini Nano. To znamená, že mobilní uživatelé mohou zpracovávat nejen textový vstup, ale také chápat více kontextových informací, jako jsou vizuály, zvuk a mluvený jazyk.

Rodina Gemini vítá nového člena: Gemini 1.5 Flash

Nový 1.5 Flash byl optimalizován pro rychlost a efektivitu.

Nová generace open source velkého modelu Gemma 2

Dnes Google také vydal řadu aktualizací pro open source velký model Gemma – Gemma 2 je tu.

Jak bylo představeno, Gemma 2 využívá novou architekturu zaměřenou na dosažení revolučního výkonu a efektivity, nové open source modelové parametry jsou 27B.

Pokud jde o dlouhá videa, Veo může produkovat videa o délce 60 sekund nebo dokonce delší. Může to udělat pomocí jednoho podnětu nebo poskytnutím série podnětů, které společně vypráví příběh. To je klíčové pro aplikaci modelů generování videa ve filmové a televizní produkci.

Veo je založeno na práci Googlu v oblasti generování vizuálního obsahu, včetně Generative Query Network (GQN), DVD-GAN, Image-to-Video, Phenaki, WALT, VideoPoet, Lumiere a dalších.